Diffusion による Text2Image の系譜と生成画像が動き出すまで
https://speakerdeck.com/nhamanasu/diffusionniyorutext2imagenoxi-pu-tosheng-cheng-hua-xiang-gadong-kichu-sumade
Diffusion
による
Text2Image
の系譜と生成画像が動き出すまで
著 :
清水遼平
(
株式会社 DeNA
)
キーワード :
画像生成 AI
前提知識
深層学習
生成モデル
Transformer
Diffusion 基礎
拡散モデル
(
Diffusion モデル
) とは
DDPM
DDIM
改良型 DDPM
Text2Image の系譜
CLIP
自然言語
と
画像
を同一
特徴量空間
で近づける
研究界隈の動き
GLIDE
Latent Diffusion Models
(
LDM
)
DALL・E 2
Text2Image
の知名度を上げた立役者
Imagen
Re-Imagen
ERNIE-ViLG 2.0
UPainting
eDiff-I
Scene-Composer
ReCo
SpaText
UniD3
Composer
大衆化
DiscoDiffusion
OSS
としての高品質
Text2Image
の先駆け
MidJourney
Stable Diffusion
:
イラスト
系の生成品質に優れる
Stable Diffusion web UI
InvokeAI
Waifu Diffusion
ゲームチェンジャー
NovelAI Diffusion
: イラスト調生成の金字塔
進化
NijiJourney
:
MidJourney
の派生
Anything
HuggingFace
、
Civtai
Danbooru
日刊 画像生成 AI
爆発的な普及による弊害と警鐘
著作権
などの権利問題
Text2Video
へ
Video Diffusion Models
Make-A-Video
Imagen Video
MagicVideo
Tune-A-Video
Gen-1
#スライド
#文献